查看原文
其他

乔布斯、鹿晗、钢铁侠?这款应用能让你分分钟变成他们

2015-09-16 元气少女虞喵喵 极客公园



或者不开心,把老板的脸换成狗狗也好呀(≧∇≦)


「我的脸变成了王劲,也可以变成李彦宏……」

在今年的百度世界大会上,百度首席科学家吴恩达在演讲中展示了一款能换脸的 APP「脸优」。除了人脸,你还可以把自己的脸换成钢铁侠、机器人或是一只狗,生成结果有着说不出的「魔性」。

就在昨天,极客公园和百度人机交互负责人顾嘉唯,聊了聊这款和 IDL(百度深度学习实验室)此前产品不太一样的应用。

藏在面具后,每个人都可以「萌萌哒」

「有很多玩法还没有人发现,」顾嘉唯拿起手机摆弄起来,「你看很多人都用前置摄像头给自己换脸,事实上后置摄像头同样可以玩儿。因为脸优支持实时换脸,你可以拍摄自己的脸再换到电脑上放着的电影里的人脸上,这样你就能出现在任何一部电影里,还能实时拍下视频分享给别人。」


除了这么玩儿,你还可以在合家团聚时让服务员代替没能出席的家人合影,并实时换上家人的脸。再或者你也可以把自己喜欢的明星换到任何一张照片、任何一部电影、任何你想让他出现的地方。换到你身边工位的同事脸上,除了可以和明星拍照还能录像。

什么?你以为只有应用下方的二十几个明星和钢铁侠可以拿来换脸玩儿?请点击应用下方一排人脸模版左侧加号进入相册选取任何一张甚至是从网络下载的照片或是拍摄自己的脸,转换到后置摄像头准任何一个明星的照片、动物、身边的朋友家人等所有你想换的「脸」进行拍摄,「变脸」的任意门就此打开。

听说已经有人为了得到万能的完美鹿晗「脸」已经试过几百张照片了啦。

以「就是要玩儿出『鬼』」为口号的脸优团队早就想好了这些奇妙玩法,但并没有对用户进行刻意地主动引导。自 9 月 8 日百度世界大会正式面世一周左右的时间内,脸优每天自然增长用户一直在万级别。后台数据显示用户留存和打开次数都指数非常可观,目前已经跻身 App Store 免费应用榜单前十名。


微博上有不少用户上传换脸后的静态照片,有个姑娘将自己的脸换成芭比娃娃拍摄了一段「萌萌哒」视频。还有个姑娘一边拍一边儿换脸,奥黛丽赫本的脸配上东北话别提多「反差萌」了。

如果你玩儿过某些视频类娱乐软件就会发现,玩儿到最后这些社区里只剩下那些「好看的人」。随意换脸的脸优给了所有人平等创作的机会——你是谁、好不好看都没关系,一颗爱玩儿的心和有趣的脑袋才最重要。

「黑科技」背后离不开技术支持

换脸的玩儿法脸优并不是第一家,但「实时」换脸这件事儿却难找到先例。

想要呈现「实时」的效果,拍摄帧率一定要达到每秒 25 帧以上才行。这相当于每秒要为 25 张以上的图片进行「换脸」,对于芯片的计算能力是不小的考验。可是一个应用大小只有 21MB、不需要联网借助云端计算能力即可使用的应用,是如何做到的呢?

「其中有些是策略性算法」顾嘉唯很小心,不过凭借其他信息也能推理出一二。

目前人脸识别的算法可以分类为:基于人脸特征点的识别算法、基于整幅人脸图像的识别算法、基于模板的识别算法、利用神经网络进行识别的算法、利用支持向量机进行识别的算法。2004 年尺寸不变特征变换(SIFT)算法出现,它将图像看作是一组形态各异特征的集合,这些特征具有尺度不变性和旋转不变性,对光源和 3D 摄影角度保持不变形。

对于脸优来说,「实时」的背后需要完成人脸识别、关键点识别、动态捕捉等多个步骤。利用对人脸 72 个特征点的定位识别,实时匹配并迁移目标特征点,计算机神经网络技术提供了不小的帮助。


▲吴恩达在百度世界大会上说道:「手机深度学习引擎使用了一个聪明的办法,在不损失效果的情况下将神经网络的模型减少,从而大量提升运行速度。」

如果你在脸优中新建过人脸,就会发现每张脸所占的空间在 200KB 左右。如果你试着玩儿过视频录制,就会发现即便是侧脸只要不是太偏,脸优依然会帮你贴上脸。事实上包括拍摄静态明星照片所创建的脸在哪,所有的「脸」都是 3D 模型。

大量 GPU 堆砌的计算机神经网络不仅代表计算力的提升,它能在数据量足够的情况下建立一个通过 2D 图片推断出 3D 模型的模型。同样它也可以将 PC 端近几百 M 尺寸的模型将至几百 KB,将深度学习系统模型缩小进行算法本地化,在没有网络的情况下普通的手机都可以存储和使用。

「怎么剥离云端,将深度学习技术应用到嵌入式移动设备上,实现端到端的算法优化是我们一直在努力的事」,脸优将这个愿望变为了现实。

为什么一直钻研人脸识别技术,时间给出了答案

为什么要做脸优?顾嘉唯的答案是「能让很多 90 后、00 后感受百度的技术也可以很酷很好玩,能让普罗大众看到到百度在人脸技术上的强有力的技术能力,未来还计划与百度大脑一起开放出来。」


两年前百度在魔图中推出过「PK 大咖」功能,能找到和每个人长得最像明星的这一功能曾一度引发热潮。百度在人脸识别技术方向的进化提供了新可能,展现方式也从静态比较变为脸优的实时动态。一个让「好莱坞特技」触手可及,全民娱乐的「脸优」,神秘的深度学习实验室第一次「接了地气」。

除此之外,百度的人脸识别技术已用在百度钱包、度秘等众多服务中得以应用。这项技术还会通过百度开放云 API,开放给各行各业使用。在百度推出的开放云多媒体解决方案中,包含不少与图片、视频相关的处理和识别服务,人脸识别技术就是图片识别服务中的一项。

多张人脸图片相似度比对、移动端的人脸注册、验证登录等功能也都在提供的服务接口中。很快人脸检测、关键点跟踪、人脸属性识别等更基础的人脸服务也会集成到开放云 API 中,为开发者、行业用户所使用。

为什么对着一个技术钻研不罢休?从单点到全方位应用,这就是时间给出的答案。


本文为极客公园原创

转载联系jianghaoke@geekpark.net

点击图片,阅读更多





科技创新者的大本营
www.geekpark.net

长按二维码,关注极客公园

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存